ارتقای کیفیت دسته بندی متون با استفاده از کمیته دسته بند دو سطحی
Authors
abstract
امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دسته بندی خودکار اهمیت ویژه ای یافته است. روش های معمول در این زمینه، روش های یادگیری ماشین هستند. روش های بر اساس کمیته کارایی بهتری نسبت به سایر روش ها از خود نشان داده اند. در این مقاله، دو ایده در زمینه کمیته های دسته بند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعه ای از مجموعه سندهای آموزشی، ساخته می شوند، ارائه شده است. بر اساس این ایده، ابتدا مجموعه آموزش با یک روش خوشه بندی به چند خوشه، بر اساس مشابهت یا عدم مشابهت کلاس های اسناد آموزشی، تقسیم می شود و سپس از روی هر خوشه از اسناد، یک دسته بند ساخته شده و به عنوان عضو کمیته قرار داده می شود (روش یادگیری اعضای کمیته یکسان است). در ایده دوم ساخت کمیته ای دو سطحی مطرح شده است. در این ایده اعضای کمیته های سطح دوم خود کمیته هایی هستند که بر مبنای ایده اول ساخته می شوند. در ارزیابی ایده اول مشخص شد که افزایش کارایی بر مبنای معیار دقت و معیار بازخوانی در کمیته بیزین ساده نوع اول، بیشتر از سایر کمیته های نوع اول بوده و به ترتیب 12 درصد و 1/5 درصد می باشد. ارزیابی ها در کمیته نوع دوم (برمبنای ایده دوم)، افزایش کارایی را نسبت به کمیته نوع اول نشان می دهند که بیشترین آن نسبت به کمیته rocchio نوع اول بوده، که معیار دقت را در حدود 8/3 درصد و معیار بازخوانی را در حدود 8/18 درصد افزایش داده است.
similar resources
ارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده میشود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند میتواند در یک، چند و یا هیچ دستهای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار میگیرد. این موضوع میتواند در قالب یک ی...
full textارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار می گیرد. این موضوع می تواند در قالب یک ی...
full textارتقای کیفیت دستهبندی متون با استفاده از کمیته دستهبند دو سطحی
امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دستهبندی خودکار اهمیت ویژهای یافته است. روشهای معمول در این زمینه، روشهای یادگیری ماشین هستند. روشهای بر اساس کمیته کارایی بهتری نسبت به سایر روشها از خود نشان دادهاند. در این مقاله، دو ایده در زمینه کمیتههای دستهبند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعهای از مجموعه سنده...
full textدسته بندی پرسش ها با استفاده از ترکیب دسته بندها
هدف از تولید و گسترش سیستم های پرسش و پاسخ، ایجاد پاسخ دقیق برای پرسش داده شده به زبان طبیعی می باشد. یکی ازمهم ترین بخش های سیستم های پرسش و پاسخ دسته بندی پرسش است. عمل دسته بندی پرسش، پیش بینی نوع پاسخ مورد نیاز برای پرسش داده شده به زبان طبیعی می باشد. کارهای انجام شده در این زمینه را می توان در دو دسته ی مبتنی بر قانون و مبتنی بر یادگیری تقسیم کرد. در این مقاله برای دسته بندی پرسش ها، از ی...
full textارتقای کیفیت دستهبندی متون با استفاده از کمیته دستهبند دو سطحی
Nowadays, the automated text classification has witnessed special importance due to the increasing availability of documents in digital form and ensuing need to organize them. Although this problem is in the Information Retrieval (IR) field, the dominant approach is based on machine learning techniques. Approaches based on classifier committees have shown a better performance than the others. I...
full textارائه روشی کارا برای دسته بندی مسائل چنددسته ای با رویکرد انتخاب دسته بند
سیستمهای دسته بندی شورایی، رویکردی مؤثر در یادگیری ماشین است که در آن با ترکیب نتایج چند دسته بند سعی می شود تقریب بهتری از یک دسته بند بهینه فراهم شود. در حوزه ترکیب خروجی شورای دستهبندها، رویکرد «انتخاب دستهبند» توجه کمتری را در مقایسه با رویکرد «ادغام دسته بند» به خود جلب کرده است. همچنین، اغلب روشهای موجود در این حوزه، هزینه محاسباتی بالایی دارند. در این مقاله، روشی مؤثر در دسته بندی مسائل ...
full textMy Resources
Save resource for easier access later
Journal title:
نشریه دانشکده فنیPublisher: دانشکده فنی
ISSN 0803-1026
volume 41
issue 7 2007
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023